Model Selection

Audio Classification

# Audio Classification

Felguk Suno Or People

This model is used to classify audio clips as either 'Suno' music or 'People' music.

Audio Classification

Transformers Supports Multiple Languages

Whisper Tiny Tel Tam Try1

A fine-tuned audio classification model based on openai/whisper-tiny, excelling in voice command datasets

Audio Classification

Ph Audio Classification V1

A fine-tuned audio classification model based on DistilHuBERT, achieving 100% accuracy on the evaluation set

Audio Classification

Music Classifier

Audio classification model based on Wav2Vec2 for music genre recognition

Audio Classification

Ast Finetuned Audioset 10 10 0.4593 Finetuned Gtzan

This model is an audio classification model based on the AST architecture and fine-tuned on the GTZAN music classification dataset, achieving an accuracy of 89%

Audio Classification

My Awesome Mind Model

An audio classification model fine-tuned on the minds14 dataset based on facebook/wav2vec2-base

Audio Classification

Ast Finetuned Audioset 10 10 0.4593 Finetuned Gtzan

This model is a fine-tuned version of Audio Spectrogram Transformer (AST) on the GTZAN music classification dataset for audio classification tasks, achieving an accuracy of 88%.

Audio Classification

Speech Emotion Recognition With Facebook Wav2vec2 Large Xlsr 53

A speech emotion recognition system fine-tuned on Wav2Vec2 Large XLSR-53 model, capable of identifying 7 common emotions

Audio Classification

AST ASVspoof5 Synthetic Voice Detection

A synthetic speech detection model fine-tuned based on MIT/ast-finetuned-audioset-10-10-0.4593, used to identify whether an audio is synthetic speech.

Audio Classification

Genrevim Music Detection DistilHuBERT

This model is a fine-tuned audio classification model based on DistilHuBERT, specifically designed to distinguish between music and non-music audio.

Audio Classification

A 5-class audio classification model fine-tuned on the superb dataset based on the wav2vec pre-trained model

Audio Classification

Wav2vec Base Crema Sentiment Analysis

A speech emotion analysis model fine-tuned based on facebook/wav2vec2-base, achieving 70.87% accuracy on the evaluation set

Audio Classification

Wav2vec2 Base Finetuned Ks

An audio classification model fine-tuned on an audio folder dataset based on the wav2vec2-base model, achieving 99.82% accuracy on the validation set

Audio Classification

Violence Detect 44

An audio classification model fine-tuned from facebook/wav2vec2-base-960h for detecting violent sounds

Audio Classification

My Awesome Mind Model

An audio classification model fine-tuned based on facebook/wav2vec2-base, achieving 58.92% accuracy on the evaluation set

Audio Classification

Vit Base Patch16 1024 128.audiomae As2m Ft As20k

A Vision Transformer (ViT)-based audio processing model, pre-trained on AudioSet-2M using self-supervised masked autoencoder (MAE) method and fine-tuned on AudioSet-20k

Audio Classification

Wav2vec2 Base Music Speech Both Classification Finetuned Gtzan

Audio classification model based on wav2vec2 architecture, fine-tuned on the GTZAN dataset for music and speech classification tasks

Audio Classification

Cat Dog Sounds Classification

A foundational speech recognition model based on the wav2vec 2.0 architecture, pre-trained on 960 hours of English speech data

Audio Classification

Musical Instrument Detection

A foundational speech recognition model based on the wav2vec 2.0 architecture, pre-trained on 960 hours of English speech data

Audio Classification

Classical Composer Classification New

An audio classification model based on facebook/wav2vec2-base-960h, capable of identifying the composer of classical music audio clips

Audio Classification

Distilhubert Finetuned Gtzan

This model is an audio classification model based on the DistilHuBERT architecture, fine-tuned on the GTZAN music genre classification dataset, achieving an accuracy of 89%.

Audio Classification

Ast Finetuned Audioset 10 10 0.4593 Finetuned Gtzan

This is an audio classification model based on the AST (Audio Spectrogram Transformer) architecture, fine-tuned on the GTZAN music genre classification dataset.

Audio Classification

MERT is an acoustic music understanding model based on self-supervised learning, using pseudo-labels provided by a teacher model for pre-training.

Audio Classification

Distilhubert Finetuned Gtzan

An audio classification model fine-tuned on the GTZAN music classification dataset based on distilhubert, achieving 89% accuracy

Audio Classification

Wav2vec2 Base Finetuned Gtzan

This model is an audio classification model fine-tuned on the GTZAN dataset based on facebook/wav2vec2-base, primarily used for music genre classification tasks.

Audio Classification

Wav2vec2 Base Music Speech Both Classification

An audio classification model fine-tuned based on facebook/wav2vec2-base for distinguishing between music and speech

Audio Classification

Ast Finetuned Audioset 10 10 0.4593 Finetuned Gtzan

An audio classification model based on AST architecture, fine-tuned on the GTZAN dataset for music genre classification tasks

Audio Classification

Whisper Tiny Finetuned Gtzan

An audio classification model fine-tuned on the GTZAN dataset based on openai/whisper-tiny, achieving 91% accuracy

Audio Classification

Distilhubert Finetuned Gtzan

This model is an audio classification model fine-tuned on the GTZAN music classification dataset based on DistilHuBERT, primarily used for music genre classification tasks.

Audio Classification

Ast Finetuned Audioset 10 10 0.4593

Audio Spectrogram Transformer (AST) model fine-tuned on the AudioSet dataset for audio classification tasks

Audio Classification

An audio classification model fine-tuned based on facebook/wav2vec2-base for music genre recognition

Audio Classification

Voip Classification

A fine-tuned speech classification model based on facebook/wav2vec2-base for audio folder dataset classification tasks

Audio Classification

Neunit Ks Kangyuan0601

This model is a fine-tuned audio classification model based on facebook/wav2vec2-base on the superb dataset, achieving 99.87% accuracy on the evaluation set.

Audio Classification

An audio classification model fine-tuned on the SUPERB dataset based on facebook/wav2vec2-base, achieving 99.98% accuracy

Audio Classification

A speech emotion recognition model fine-tuned based on facebook/wav2vec2-base, achieving 73.22% accuracy on the evaluation set

Audio Classification

Bird sound recognition model fine-tuned based on Microsoft's WavLM-Large model

Audio Classification

Bird Classification Model

An audio classification model fine-tuned based on facebook/wav2vec2-base for identifying bird sounds

Audio Classification

Astie Finetuned On Shemo

This model is a fine-tuned version of the AST model on the shEMO dataset, primarily used for speech emotion recognition tasks.

Audio Classification

Ast Finetuned Audioset 10 10 0.4593 Finetuned Ie

This model is a fine-tuned audio classification model based on MIT/ast-finetuned-audioset-10-10-0.4593, achieving 60.76% accuracy on the evaluation set.

Audio Classification

Audio Class Finetuned

This model is a fine-tuned audio classification model based on facebook/wav2vec2-base on the superb dataset, achieving an accuracy of 0.6578 on the evaluation set.

Audio Classification

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase